智能论文笔记

Contactless Oxygen Monitoring with Gated Transformer

Hao He , Yuan Yuan , Ying-Cong Chen , Peng Cao , Dina Katabi

分类：机器学习

2022-12-06

With the increasing popularity of telehealth, it becomes critical to ensure that basic physiological signals can be monitored accurately at home, with minimal patient overhead. In this paper, we propose a contactless approach for monitoring patients' blood oxygen at home, simply by analyzing the radio signals in the room, without any wearable devices. We extract the patients' respiration from the radio signals that bounce off their bodies and devise a novel neural network that infers a patient's oxygen estimates from their breathing signal. Our model, called \emph{Gated BERT-UNet}, is designed to adapt to the patient's medical indices (e.g., gender, sleep stages). It has multiple predictive heads and selects the most suitable head via a gate controlled by the person's physiological indices. Extensive empirical results show that our model achieves high accuracy on both medical and radio datasets.

translated by 谷歌翻译

Unsupervised Learning for Human Sensing Using Radio Signals

Tianhong Li , Lijie Fan , Yuan Yuan , Dina Katabi

分类：计算机视觉

2022-07-06

越来越多的文献证明了使用射频（RF）信号在遮挡和照明不良的情况下实现关键的计算机视觉任务的可行性。它利用RF信号遍历墙壁和遮挡，以使壁姿势估计，动作识别，场景字幕和人类重新识别。但是，与可以由人工工人标记的RGB数据集不同，标记RF信号是一项艰巨的任务，因为这些信号不是人类的可解释。但是，收集未标记的RF信号非常容易。使用此类未标记的RF数据以无监督的方式学习有用的表示形式将是非常有益的。因此，在本文中，我们探讨了调整基于RGB的无监督表示为RF信号的可行性。我们表明，尽管对比度学习已成为无监督的表示从图像和视频学习的主要技术，但当使用RF信号应用于感知人类时，这种方法的性能较差。相反，预测性无监督学习方法学习可用于多个基于RF的传感任务的高质量表示。我们的经验结果表明，这种方法的表现优于基于RF的最先进的人类对各种任务的感知，从而开放了从这种新颖方式中学习的可能性。

translated by 谷歌翻译

On Multi-Domain Long-Tailed Recognition, Imbalanced Domain Generalization and Beyond

Yuzhe Yang , Hao Wang , Dina Katabi

分类：机器学习 | 人工智能 | 计算机视觉

2022-03-17

现实世界中的数据通常显示出不平衡的标签分布。有关数据不平衡的现有研究集中在单域设置上，即样本来自相同的数据分布。但是，自然数据可以起源于不同的领域，在一个领域中的少数族裔可以从其他域中具有丰富的实例。我们正式化了多域长尾识别（MDLT）的任务，该任务从多域不平衡数据中学习，解决了跨域的标签不平衡，域移动和不同标签分布，并将其推广到所有域级对。我们首先开发了域类的可传递性图，并表明这种可传递性决定了MDLT中学习的成功。然后，我们提出了Boda，这是一种理论上的学习策略，可以跟踪可转移性统计的上限，并确保跨域级分布之间的平衡对齐和校准。我们策划了基于广泛使用的多域数据集的五个MDLT基准测试，并将BODA与跨越不同学习策略的二十个算法进行比较。广泛而严格的实验验证了BODA的出色性能。此外，作为副产品，Boda建立了有关域泛化基准测试的新的最新最先进，强调了解决跨域数据不平衡的重要性，这对于改善概括至看不见的域可能至关重要。代码和数据可在以下网址获得：https：//github.com/yyzharry/multi-domain-mmbalance。

translated by 谷歌翻译

Unsupervised Domain Generalization by Learning a Bridge Across Domains

Sivan Harary , Eli Schwartz , Assaf Arbelle , Peter Staar , Shady Abu-Hussein , Elad Amrani , Roei Herzig , Amit Alfassy , Raja Giryes , Hilde Kuehne

分类：计算机视觉

2021-12-04

概括跨越不同视觉域的学习表现的能力，例如在真正的照片，剪贴画，绘画和草图之间是人类视觉系统的基本容量。在本文中，不同于利用一些（或全部）源域监控的大多数跨域工作，我们接近一个相对较新的，非常实用的无监督域泛化（UDG）设置在既不源也不在源域中没有培训监督。我们的方法是基于跨域（BRAD）的桥梁的自我监督学习 - 辅助桥域附有一组从每个训练域的Brad将视觉（图像到图像）映射保留的一组语义。 BRAD和MAPPAPAPPED（端到端）与对比的自我监督表示模型一起学习（端到端），其用语义对齐每个域将每个域对齐，因此隐含地驱动所有域（见或看不见）语义上彼此对齐。在这项工作中，我们展示了如何使用边缘正则化的布拉德，我们的方法在多个基准和一系列任务中实现了显着的增益，包括UDG，少量UDA和跨多个域数据集的无监督概括（包括指向未经看明域的概念和课程）。

translated by 谷歌翻译

Targeted Supervised Contrastive Learning for Long-Tailed Recognition

Tianhong Li , Peng Cao , Yuan Yuan , Lijie Fan , Yuzhe Yang , Rogerio Feris , Piotr Indyk , Dina Katabi

分类：计算机视觉

2021-11-27

现实世界数据往往展现出长期分布，重量级别不平衡，其中大多数课程可以主导培训过程并改变少数阶层的决策边界。最近，研究人员调查了监督对长尾识别的对比学习的潜力，并证明它提供了强大的性能增益。在本文中，我们表明，虽然监督对比学习可以有助于提高性能，但过去的基线通过不平衡数据分布引入的均匀性差。这种差的均匀性在来自特征空间中具有差的少数阶级的样品中表现出来。为了解决这个问题，我们提出了有针对性的监督对比学习（TSC），从而提高了极度上的特征分布的均匀性。 TSC首先生成一组均匀分布在极度上的目标。然后，在训练期间使不同类别的特征会聚到这些不同的和均匀分布的目标。这迫使所有类别，包括少数群体类别，以维持特征空间中的统一分布，改善了类边界，即使在存在长尾数据的情况下也能提供更好的泛化。多个数据集的实验表明，TSC在长尾识别任务上实现了最先进的性能。

translated by 谷歌翻译

Addressing Feature Suppression in Unsupervised Visual Representations

Tianhong Li , Lijie Fan , Yuan Yuan , Hao He , Yonglong Tian , Rogerio Feris , Piotr Indyk , Dina Katabi

分类：机器学习 | 计算机视觉

2020-12-17

对比学习是机器学习中最快的研究领域之一，因为它可以在没有标记数据的情况下学习有用的表示。然而，对比学学习易于特征抑制，即，它可能会丢弃与感兴趣的任务相关的重要信息，并学习无关的功能。过去的工作通过消除无关信息的手工制作的数据增强解决了这一限制。然而，这种方法不适用于所有数据集和任务。此外，当一个属性可以抑制与其他属性相关的特征时，数据增强在解决多属性分类中的功能抑制中失败。在本文中，我们分析了对比学习的目标函数，并正式证明它易于特征抑制。然后，我们提出预测对比学习（PCL），一种学习对特征抑制具有鲁棒的无监督表示的框架。关键的想法是强制学习的表示来预测输入，因此防止它丢弃重要信息。广泛的实验验证PCL是否强大地对特征抑制和优于各种数据集和任务的最先进的对比学习方法。

translated by 谷歌翻译

Clinical Language Understanding Evaluation (CLUE)

Travis R. Goodwin , Dina Demner-Fushman

分类：自然语言处理

2022-09-28

近年来，临床语言处理引起了很多关注，导致了新的模型或疾病表型，死亡率预测和其他任务的方法。不幸的是，这些方法中的许多方法都经过不同的实验设置（例如数据源，培训和测试拆分，指标，评估标准等）的测试，从而使其难以比较方法并确定最新方法。为了解决这些问题并促进可重复性和比较，我们通过一组四个临床语言理解任务，标准培训，开发，验证和测试集介绍了临床语言理解评估（线索）基准，从模拟数据以及软件中得出的测试集工具包。我们希望这些数据能够在方法之间进行直接比较，提高可重复性，并减少为这些临床语言理解任务开发新型模型或方法的进入的障碍。

translated by 谷歌翻译

Label Sleuth: From Unlabeled Text to a Classifier in a Few Hours

Eyal Shnarch , Alon Halfon , Ariel Gera , Marina Danilevsky , Yannis Katsis , Leshem Choshen , Martin Santillan Cooper , Dina Epelboim , Zheng Zhang , Dakuo Wang

分类：自然语言处理

2022-08-02

文本分类在许多真实世界的情况下可能很有用，为最终用户节省了很多时间。但是，构建自定义分类器通常需要编码技能和ML知识，这对许多潜在用户构成了重大障碍。为了提高此障碍，我们介绍了标签侦探，这是一种免费的开源系统，用于标记和创建文本分类器。该系统对于（a）是一个无代码系统是独一无二的分类器在几个小时内，（c）开发用于开发人员进行配置和扩展。通过开放采购标签侦探，我们希望建立一个用户和开发人员社区，以扩大NLP模型的利用率。

translated by 谷歌翻译

A Recommender System for Equitable Public Art Curation and Installation

Anna Haensch , Abiy Tasissa , Dina Deitsch

分类：机器学习

2022-07-28

艺术在公共空间中的放置可能会对谁感到归属感产生重大影响。在城市中，公共艺术传达了其利益和文化受到青睐的传播。在本文中，我们提出了一种具有局部约束的图形匹配方法，以构建一个以支持包容空间的方式选择公共艺术的策展工具。我们通过利用Schelling的隔离模型来开发成本矩阵。使用成本矩阵作为输入，通过投影梯度下降来解决优化问题，以获得软分配矩阵。我们讨论正式化术语以设置策展约束。我们的优化计划通过满足最低代表和暴露标准，将艺术品分配给公共空间和墙壁，以取消优先级的“小组内”偏好。我们利用现有文献来为我们的算法输出开发公平度量。我们将塔夫茨大学作为测试台，我们评估方法的有效性，并从策展和公平的角度讨论其潜在的陷阱。

translated by 谷歌翻译

Partial Resampling of Imbalanced Data

Firuz Kamalov , Amir F. Atiya , Dina Elreedy

分类：机器学习

2022-07-11

不平衡的数据是机器学习中经常遇到的问题。尽管有关数据不平衡的抽样技术有大量文献，但仍有有限的研究解决了最佳抽样比率的问题。在本文中，我们试图通过对抽样比对分类准确性的影响进行大规模研究来填补文献中的空白。我们考虑10种流行的抽样方法，并根据20个数据集评估其性能。数值实验的结果表明，最佳采样比在0.7至0.8之间，尽管确切比率取决于数据集。此外，我们发现，尽管原始不平衡比率或功能数量在确定最佳比率方面没有可见作用，但数据集中的样本数量可能会产生切实效果。

translated by 谷歌翻译